Probability And Statics
機率與統計
點估計
母體(常態分佈或是白努力分布)
- 有母數統計
- 大母體: 抽不完的母體,抽樣數量大於30
- 小母體: 有限的母體,抽樣數量小於30
對於一個母體的抽樣,一次抽出n個,進行j次抽樣
.
.
.
平均數
- 樣本平均數:
- 樣本平均數的平均數:
在抽樣趨近數量趨近於無限的時候, n -> inf
- 每次抽樣的樣本平均數的平均數會接近於母體平均數
點估計的不偏估計量
- 樣本平均數 等於 母體平均數
- 理想情況
樣本平均數的分布函數
- 樣本平均數的分布情況
- 常見的是常態分佈
區間估計
區間估計的誤差
- 信賴區間
- confidence interval
- 母體平均數與樣本平均數的誤差
- confidence interval = point estimate
margin of error - E(margin of error) = (critical value) * (
of the statics)
- E(margin of error) = (critical value) * (
區間估計,用於估計
- 平均數
- 母體成功機率
- 標準差
信賴值
- 在一個區間內,樣本平均數的分布函數的機率值
is 顯著水準 - =
一個 x s.t. 標準常態累積函數P(x)為 - 標準化過的數值,反著算回去可以得到
- 就是critical value
- 標準化過的數值,反著算回去可以得到
- 把樣本平均值分布函數變成標準常態分布函數
- 即是上圖左方粉色區域
母體平均值區間估計
Ex.
- 母體是常態分佈 且 np > 5 且 nq >5 且 n >30 則抽樣近似常態分佈
- 給定一個
- 根據常態分佈累積表格,查詢value為
的x為多少 - 將x反標準化
- 得到
- (
, )
table
- 可以對應不同的母體情況,使用不同的公式
t分布
- 類似信賴區間的critical value
- 對稱型的分布
- 機率分布表示從
到正無限大 - 根據自由度
- 樣本平均數的自由度n-1
- 母體平均數的自由度n
- 根據自由度
- 用於代替平均值信賴區間的估計
- 在不知道母體標準差的情況下
母體比率區間估計(母體成功機率)
估計母體比率p的區間在哪裡?
如果知道母體的比例
- 透過上面的方法可以找出信賴區間
如果不知道母體的比例
- 可以用樣本的比例代替
Ex 8.15
- 每次都抽300個消費者來當作樣本
- 母數為0.4
母體變異數區間估計
利用樣本的變異數估計母體的變異數
- 樣本的變異數是卡方分布
卡方分布
Ex.
長相
- n越大,越像常態分佈
機率表
- 不用做Z分布(標準化)
- 不是常態分佈
- 如果要做雙尾的檢定
- 左右兩邊都需要
- 則右邊的
會使右尾機率為 - 左邊的
會使得右尾機率為
- 左右兩邊都需要
- 自由度
- 抽樣的樣本數
母體平均數未知
- 無法計算
,無法得到卡方分布 - 使用樣本平均數
獲得信賴區間
- Ex.
- 只能用變異數推變異數
- 點估計中,樣本變異數是母體變異數的不偏估計量
容許估計誤差,需要抽多少樣本,才能達到
也就是利用
- 母體平均值的估計誤差
- 母體成功率的估計誤差
Probability And Statics
https://z-hwa.github.io/webHome/[object Object]/Probability And Statics/Probability-And-Statics/